生成AIの未来地図と羅針盤~ 革新的な生成AIの活用と課題解決
本稿では、生成AIの現状を踏まえ、その仕組み、ユースケース、また抱える課題と対策、そして未来への展望について掘り下げます。
本稿では、生成AIの現状を踏まえ、その仕組み、ユースケース、また抱える課題と対策、そして未来への展望について掘り下げます。
生成AIの技術進歩は、2024年を迎え、さらなる転換点に達しています。Chat GPT1のようなアプリケーションの台頭により、AIの応用範囲が拡大し、従来のテクニカルな領域から広く一般の領域にまで及ぶようになりました。生成AIとは、ニューラルネットワークを用いて新たなコンテンツを生成する技術のことで、金融アドバイスの個別化や橋梁設計の効率化など多岐にわたる分野で応用されています。その一方で、誤情報やプライバシー侵害などの課題も存在し、透明性の確保やユーザーが信頼性を判断できるシステム構築が必要です。AIの持続可能な発展には国際的な連携が重要であると同時に、人間側の倫理観や洞察力も養う必要があります。
本稿では、生成AIの現状を踏まえ、その仕組み、ユースケース、また抱える課題と対策、そして未来への展望について掘り下げます。
なお、本文中の意見に関する部分については、筆者の私見であることを、あらかじめお断りいたします。
Point
- 生成AIの概要
生成AIは、人間の脳を模倣したニューラルネットワークを基に、GPT、VAE、GANなどのモデルを使用してテキストや画像などの新しいコンテンツを生成する技術で、製造業からカスタマーサービス、エンターテイメントまで幅広い分野で応用されている。2023年春と比べると、2023年下半期~2024年にかけて、テキスト生成だけでなく、画像や動画などのマルチモ-ダル化が進展・精度向上したことで、活用できる業界や業種が増えた。 - アプリケーションの種類とユースケース
生成AIは、①既存業務の支援、②業務の高度化、そして③ビジネスモデルの革新に至るまで、テキスト生成、画像生成、データ拡張などを活用し、多岐にわたる分野でビジネスプロセスと産業界に革新をもたらしている。特に昨今は、③の生成AI活用の真価である「業務革新」が目覚ましく発展しており、本当の価値創造はここにあると言える。 - 生成AIの抱える課題と展望
生成AIは社会に革新をもたらす可能性を秘めているが、ハルシネーションやバイアスなどの課題を抱えている。これらの課題に対処するためには、AIの動作原理の透明性を確保し、人間の介入を通じた監視システムの導入と、技術者や企業、政府の国際的な連携が重要である。
I.生成AIの概要
2017年に「Transformer」と呼ばれる深層学習モデルの構造が提案されて以降、言語モデルの性能が飛躍的に向上し、GPT-3などの大規模な言語モデルが登場しました。
Transformerは、「Self-Attention」と呼ばれる仕組みを使って、入力データの異なる部分間の関係性を学習します。これにより、文章の前後関係や画像の構成要素間の関連性を捉えることができるようになりました。これらの言語モデルは、与えられたテキストに基づいて文章を生成したり、質問に答えたりすることができます。一方で、画像生成の分野でも、VAE(Variational Auto Encoders)、GAN(Generative Adversarial Networks)などの手法が開発され、リアルな画像を生成できるようになりました(図表1参照)。
図表1 深層生成AIモデルの特徴
特徴 | VAE | GAN |
---|---|---|
目的 | データの圧縮と生成 | リアルなデータの生成 |
モデル構造 | エンコーダ(入力を圧縮)とデコーダ(入力の再構築) | ジェネレーター(新しいデータの作成)と識別器(それを評価) |
生成データ | 滑らかで連続的 | 鮮明で多様 |
適用分野 | 異常検知、次元削減、データ補間 | 高解像度画像生成、スタイル変換、データ拡張 |
出所:KPMG作成
II.マルチモーダル生成AI
前述した生成モデルは、主に単一のモダリティ(テキストか画像のいずれか)に特化していました。それに対して、マルチモーダル生成AIはこれらの技術を組み合わせ、テキスト、画像、音声など複数のモダリティを同時に処理し、相互に関連性を学習することで、より高度で多様な生成が可能となります。マルチモーダル生成AIは、2020年頃から研究が活発化し、Transformerアーキテクチャをベースとしながら、Self-AttentionとCross-Attentionを活用しています(図表2参照)。
図表2 Attentionの特徴
特徴 | Self-Attention | Cross-Attention |
---|---|---|
目的 | 同一モダリティ内の関係性を学習 | 異なるモダリティ間の関係性を学習 |
入力 | 単一モダリティのデータ | 複数モダリティのデータ |
適用対象 | テキスト、画像、音声など | テキストと画像、画像と音声など |
関係性の種類 | 文章の前後関係、画像の構成要素間の関連性など | テキストと画像の対応関係、画像と音声の同期関係など |
応用例 | 機械翻訳、テキスト要約、画像の特徴抽出 | 視覚的質問応答、テキストから画像への生成、オーディオビジュアル音声認識 |
出所:KPMG作成
企業がマルチモーダル生成AIを導入することで、顧客とのコミュニケーションをより自然で魅力的なものにできる可能性があります。たとえば、製品説明の自動生成、ユーザー問い合わせへの多様な応答、広告コンテンツの作成など、さまざまな場面で活用できます。また、この技術を活用することで、業務の効率化や新たな価値の創出が期待できます。
Ⅲ.アプリケーションの種類と ユースケース
このように、生成AIのアプリケーションは多岐に渡ります。テキスト生成、画像生成、音楽生成、データ拡張などにより、幅広い用途で活用され、ビジネスプロセスと産業界に革新をもたらしています。その活用は、「既存業務の支援」、「業務の最適化」、「業務やビジネスモデルの革新」の3 つに分けることができます( 図表3参照)。
図表3 ビジネスプロセスにおける生成AIの活用
①既存業務の支援
1つ目は、メール文案作成や文書の要約など、既存の業務プロセスをサポートすることに焦点を当てたユースケースです。社内に点在する情報を集めてレポートを生成したり、いくつかのキーワードからプレゼンテーション資料や動画を生成したり、またテキスト情報から音楽を作ったりすることも可能です。
- KPMG社内での生成AIの活用
KPMG Germanyは、生成AIを活用した独自のChat Bot KaiChat (KPMG AI Chat) を開発しました。約13,000人の従業員がさまざまな事業領域で、KaiChatを介してKPMGの専門知識にリアルタイムでアクセスし、利用しています。KaiChatはOpen AIモデルを使用していますが、KPMG環境からデータが流出しないように設計されており、ビジネスコンテキストでの機密性の高いタスクにも使用されています。KPMG Australiaでも社内のチーム間のコラボレーションを促すことができる、人的リソースを探索するツールとしてChat GPT の独自バージョンを活用しています。
②業務の最適化
2つ目は、生成AIを活用して業務プロセスの高度化と効率化を目的としたユースケースを紹介します。これは、特に金融や製造業で見られます。
- 金融機関における個別化された金融アドバイス
従来の金融機関での顧客に対するアドバイスは、広範な顧客層に適用可能な一般的なものが主流でした。個々の顧客のニーズや資産状況を十分に考慮したアドバイスの提供には、対応する行員の経験と知識、対応に要する時間を必要とするからです。しかし、生成AIの導入により、金融機関は顧客一人ひとりの詳細な資産状況や将来の財務目標、リスク許容度などを深く理解することが可能になりました。生成AIは、これらの個別情報を基に、顧客ごとに最適化された金融戦略を提案でき ます。
たとえば、AIは顧客の投資歴、現在の資産配分、市場動向を分析し、個人の目標達成に向けた具体的な投資提案を生成します。このアプローチにより、金融機関は顧客の財務状況と目標に沿った、よりパーソナライズされたアドバイスを提供することが容易となり、結果的に資産運用の最適化と顧客満足度の向上が実現できます。
- 建設会社における橋梁設計
建設業界における橋梁設計は、その安全性と機能性を確保するために、高度な専門知識と膨大な時間、そしてコストが必要とされる複雑なプロセスです。設計段階において多くのパラメーターを考慮し、数々のシミュレーションを実施する必要がありました。しかし、生成AIの活用により、このプロセスが劇的に変化しました。AIが橋梁の設計パラメーター、地理的条件、使用材料の特性など、膨大なデータセットから学習し、最適な設計案を迅速に提案するからです。
さらに、AIは異なる設計案の安全性とコスト効率を予測し、建設プロジェクトの意思決定の支援もします。これにより、建設会社はより安全でコスト効率の高い橋梁を設計し、プロジェクトの全体的な時間とコストの削減を実現しました。また、生成AIを活用することで、従来は見出せなかったような、革新的な構造設計も探求できるようになり、建設業界における技術革新の促進に貢献しています。
- アパレル企業におけるバーチャル試着体験
かつて、アパレル企業では実店舗での試着が主流でしたが、オンラインショッピングの普及によりバーチャル試着体験の需要が高まっています。生成AIを用いることで、顧客の体型や顔写真からリアルなバーチャル試着体験を生成し、オンラインでの購買体験を大幅に向上させることが可能になりました。
- 飲料メーカーにおけるパッケージデザイン
従来、飲料メーカーではパッケージデザインを手作業や基本的なソフトウエアツールを用いて行っていました。しかし、この手法はデザインの選定に時間がかかり、市場のトレンドに即応することが難しいという課題がありました。
生成AIの活用で、消費者の嗜好や最新のトレンドデータを基に、多様なデザイン案を迅速に生成することが可能になります。これにより、デザインの検討期間が短縮され、より魅力的なパッケージを市場に提供することができるようになりました。
③業務やビジネスモデルの革新
最後は、生成AIを用いた業務プロセスやビジネスモデルの根本的な変革が期待されているユースケースです。
- AI創薬技術による医薬品開発の 変革
従来の医薬品開発プロセスは、膨大な時間とコストがかかり、成功率も低いという大きな課題がありました。特に、新薬候補の同定と初期試験の段階で多くの時間を要し、多額の研究開発費が投じられていました。
これまでも、AIを使った開発は行われてきましたが、従来のAIと生成AIは創薬プロセスにおける役割と適用方法が異なります。従来のAIは、AIを用いて大規模な化合物ライブラリから活性の高いものをスクリーニングしたり、新しい疾患に適用できるかを予測したり、化合物の潜在的な副作用を予測するなど、既存のデータを基に予測や分類を行うことに焦点を当てていました。これに対し、生成AIは望みの特性を持つ新規化合物を自動的に設計・生成したり、目的の化合物を合成するための最適な反応経路を提案したり、異なる種類のデータを統合するなどマルチモーダルな活用も可能です。
この技術により、従来数年から数十年かかっていた新薬の開発期間を大幅に短縮することができ、研究開発コストの削減にもつながります。
- AIショッピングアシスタントによるリテール業界のイノベーション
リテール業界では、従来、顧客の購買行動を理解し、パーソナライズされたショッピング体験を提供することが課題でした。顧客一人ひとりの好みやニーズに合わせた商品の推薦や購買体験の向上は、大量のデータ分析と細やかな顧客対応を必要としていました。
大手リテール企業が開発したAIショッピングアシスタントは、この課題に革新的な解決策を提供しています。顧客の過去の購買履歴、ブラウジングデータ、さらにはソーシャルメディア上の活動などから、顧客の好みやニーズを学習するからです。そして、生成AIを用いて、顧客に最適な商品やプロモーションをリアルタイムで提案します。これにより、顧客は圧倒的な商品のなかから自分に最適な選択を容易に行うことができ、購買体験の質が飛躍的に向上します。また、企業側は顧客の満足度向上と同時に、在庫管理やマーケティング戦略の最適化を実現できます。
- エンターテインメント分野での革新
エンターテインメント業界では、マルチモーダルな生成AIが新たな体験を創出しています。たとえば、映画制作においては、脚本のテキストから自動的にシーンのビジュアルコンセプトアートを生成するシステムが開発されています。このAIは、テキストで説明されたシーンの雰囲気やキャラクターの感情を理解し、それに合った画像を生成します。これにより、映画のプリプロダクション段階でのビジュアルイメージの共有が容易になり、制作プロセスの効率化とクリエイティブなアイデアの具現化が可能になります。
- ヘルスケア分野での活用
患者の診断に高度な専門性を要するヘルスケア分野では、診断の精度や速度に課題がありました。この課題解決のために、マルチモーダルな生成AIを利用、患者の診断支援や治療計画の策定を行うシステムが導入されています。このシステムは、患者の言語的説明( テキスト)と医療画像(ビジュアルデータ)、患者の声のトーン(音声データ)など、複数のデータソースから情報を収集し、統合的に分析します。それにより、より早く、より正確な診断が可能となりました。さらには、個々の患者に合わせたパーソナライズされた治療計画の提案まで、生成AIの技術によって作成可能になります。
Ⅳ.生成AIが抱える課題と展望
1. 生成AIが抱える課題
生成AIは社会に大きな変革をもたらす可能性を秘めた技術である一方で、大きな課題も抱えています。よく知られているものには、「ハルシネーション( 幻覚)」があります。これは、生成AIモデルが存在しない情報や矛盾するデータを生成するという現象です。他にも誤情報、バイアス、プライバシー侵害などといった問題は、社会的、政治的な混乱を引き起こす可能性があります。特に、AIが生成する情報の正確性、中立性は守られるべき課題です。
2. 課題への対策
対策としては、AIの動作原理や使用するデータソースに関する透明性を確保し、ユーザーがAI生成情報の信頼性を判断できるようにすることです。どのように判断し、どのようなデータに基づいて生成しているのか、という責任の所在を明確にすることが重要となります。また、「人間のループ」と言われる人の介入を通したリアルタイム監視システムの導入も必要です。それにより、ハルシネーションや誤情報を防止し、個人のプライバシー保護や著作権の尊重を保証します。技術的には、RAG (Retrieval-augmented Generation)やRLHF (Reinforcement Learning from Human Feedback )を用います。RAGは信頼できる外部知識源( 知識ベース)から情報を検索(Retrieval )し、生成過程に組み込むことで、より正確で信頼性の高い文章生成を実現しますし、RLHFはその「人間のフィードバックからの強化学習」という意味のとおり、人間の価値基準に合うように言語モデルをチューニングしたりすることで、ハルシネーションを防止します。
誤情報やバイアス、プライバシー侵害に対しては、今は、たとえばAIによって生成されたコンテンツにデジタル透かしを付け、その出所を識別できるようにすることで、偽情報の拡散を防ぐ取組みが行われています。今後は、偏見の検出や悪用防止、責任説明などのツールの開発が求められます。AI技術の持続可能な発展を促進するためには、国を越えて技術者、企業、政府、そして一般ユーザーが連携して、包括的な対策を講じることが重要となります。たとえば、国際的な倫理委員会の設立や倫理的なガイドラインの策定・改定などです。定期的なワークショップやシンポジウムの開催を通して、AI技術に関する一般ユーザーの教育と意識向上を図ることも重要です。一人ひとりが、AIが生成する情報の読み解き方、信頼できる情報源の識別方法を身に着けるなど、デジタルリテラシーの向上が求められます。
3. 生成AIが社会に与える影響
こうした生成AIの技術進化は、単なる技術の域を超え、社会構造そのものや人類の未来に変革をもたらす可能性を秘めています。産業界でも、新しい産業の創出と既存産業の変革を促進し、産業構造の変化をもたらすでしょう。今後は、マルチモーダルAIの進化により、異なるタイプのデータを統合的に解析・処理する能力が強化され、ビジネスの意思決定、製品開発、マーケティング戦略が根本から変わることが予想されます。
AIの自動化能力の向上は、労働市場の再編を促し、特定の職種の需要減少を引き起こす可能性がありますが、同時に新たなスキルセットを要求する雇用機会の創出も見込まれます。経済学の基本原理に従い、資源の再配分と効率化により、経済全体の生産性向上が期待されます。
社会課題に対しても、パーソナライズされた学習コンテンツの提供や診断支援ツールなどの応用により、教育と医療分野に革新をもたらしたり、生成AIのデータ分析能力によって気候変動やエネルギー管理、都市計画などへの対応を可能にしたりするなど、持続可能な社会への貢献が考えられます。
4. 生成AIの未来
生成AIが人間の感情を理解し、精神的なサポートを行ったり、AIクローンを生成し、社員の業務を代行したりするなど、より幅広く柔軟な活用が開発される一方で、技術的な展望としては、独自データの活用とマルチモーダル化が、人工知能の進化の次のフロンティアを形成しています。
生成AIには創造性や革新性を持ったデータ生成が期待されていますが、その真価を発揮するためには、独自データの活用が不可欠です。主な利点は次の4 つ です。
①カスタマイズと適応性
一般的なデータセットではなく、特定の業界や応用分野に関する独自のデータを使用することで、より具体的な問題に対処するための高性能な生成モデルが構築されるなど、独自のニーズに対応することができるようになります。
②差別化と競争力
他の一般的なモデルや競合他社との差別化が可能となり、独自の洞察や最適化されたソリューションは競争上の優位性を提供します。
③プライバシーとセキュリティ
自社で独自データを収集・管理することにより、プライバシーやデータセキュリティを強化することができます。
④データの質と関連性
独自のデータを用いて生成モデルを追加学習( ファインチューニング)することで、データの質と関連性が向上します。これにより、より正確で有用な生成結果が期待できます。
マルチモーダルAIは、テキスト、画像、音声など複数のモダリティから情報を統合し、より複雑な問題を解決する能力を持ちますが、この進化は、AIにとって人間のような複合的な理解能力をもたらし、より自然な人間とのインタラクションを可能にします。しかし、この技術の適用は、人間の感覚と認知の複雑さを模倣することの難しさを浮き彫りにします。そのため、マルチモーダルAIの開発には、認知科学、心理学、言語学など、多様な分野の知見が必要となります
Ⅴ.さいごに
今まで見てきたように、生成AIのポテンシャルを最大限に引き出し、社会にとって意義深い進化を実現するには、企業のみならず、開発者、利用者一人ひとりが、この新しい技術によって何を実現したいのか、何を大切にして生きていきたいのかを改めて問う必要があるかもしれません。
たとえば、倫理観の強化は、AIの開発と利用が人間の尊厳と価値を尊重することを保証し、社会的な信頼を築くうえで重要です。また、洞察力は人間とAIのインタラクションをより豊かで意味のあるものに変え、AIの社会的受容性を高めるでしょう。
どれだけテクノロジーが進化しようとも、それを使っていくのは人間です。私たちは多様な可能性に心を開くと同時に、自身の奥深くに根差した感性を大切にしつつ、さまざまなものとの相互関係のなかで成立する人間という存在が全体として成長する道を探求することが、現代社会における重要な課題であると考えます。
1 ChatGPTはOpenAI社の商標です。
執筆者
KPMGアドバイザリーライトハウス
デジタルインテリジェンス リード
佐藤 昌平/マネジャー
デジタルインテリジェンス
齊藤 弓/コンサルタント
KPMGコンサルティング
テクノロジートランスフォーメーション
山邊 次郎/シニアマネジャー